تحلیل آماری جلسه اول )جمعه مورخه 1131/70/11(

Σχετικά έγγραφα
محاسبه ی برآیند بردارها به روش تحلیلی

روش محاسبه ی توان منابع جریان و منابع ولتاژ

آزمون مقایسه میانگین های دو جامعه )نمونه های بزرگ(

مسائل. 2 = (20)2 (1.96) 2 (5) 2 = 61.5 بنابراین اندازه ی نمونه الزم باید حداقل 62=n باشد.

تخمین با معیار مربع خطا: حالت صفر: X: مکان هواپیما بدون مشاهده X را تخمین بزنیم. بهترین تخمین مقداری است که متوسط مربع خطا مینیمم باشد:

همبستگی و رگرسیون در این مبحث هدف بررسی وجود یک رابطه بین دو یا چند متغیر می باشد لذا هدف اصلی این است که آیا بین

مفاهیم ولتاژ افت ولتاژ و اختالف پتانسیل

مثال( مساله الپالس در ناحیه داده شده را حل کنید. u(x,0)=f(x) f(x) حل: به کمک جداسازی متغیرها: ثابت = k. u(x,y)=x(x)y(y) X"Y=-XY" X" X" kx = 0

تصاویر استریوگرافی.

1) { } 6) {, } {{, }} 2) {{ }} 7 ) { } 3) { } { } 8) { } 4) {{, }} 9) { } { }

تحلیل مدار به روش جریان حلقه

جلسه ی ۱۰: الگوریتم مرتب سازی سریع

فصل دهم: همبستگی و رگرسیون

جلسه 3 ابتدا نکته اي در مورد عمل توابع بر روي ماتریس ها گفته می شود و در ادامه ي این جلسه اصول مکانیک کوانتمی بیان. d 1. i=0. i=0. λ 2 i v i v i.

شاخصهای پراکندگی دامنهی تغییرات:

آموزش SPSS مقدماتی و پیشرفته مدیریت آمار و فناوری اطالعات -

ﯽﺳﻮﻃ ﺮﯿﺼﻧ ﻪﺟاﻮﺧ ﯽﺘﻌﻨﺻ هﺎﮕﺸﻧاد

مدار معادل تونن و نورتن

فعالیت = ) ( )10 6 ( 8 = )-4( 3 * )-5( 3 = ) ( ) ( )-36( = m n m+ m n. m m m. m n mn

باشند و c عددی ثابت باشد آنگاه تابع های زیر نیز در a پیوسته اند. به شرطی که g(a) 0 f g

جلسه 9 1 مدل جعبه-سیاه یا جستاري. 2 الگوریتم جستجوي Grover 1.2 مسا له 2.2 مقدمات محاسبات کوانتمی (22671) ترم بهار

قاعده زنجیره ای برای مشتقات جزي ی (حالت اول) :

آزمایش 1: پاسخ فرکانسی تقویتکننده امیتر مشترك

سايت ويژه رياضيات درسنامه ها و جزوه هاي دروس رياضيات

جلسه ی ۴: تحلیل مجانبی الگوریتم ها

Beta Coefficient نویسنده : محمد حق وردی

فصل چهارم : مولتی ویبراتورهای ترانزیستوری مقدمه: فیدبک مثبت

هو الحق دانشکده ي مهندسی کامپیوتر جلسه هفتم

جلسه ی ۵: حل روابط بازگشتی

خالصه درس: نویسنده:مینا سلیمان گندمی و هاجر کشاورز امید ریاضی شرطی. استقالل متغیر های تصادفی پیوسته x و y استقالل و امید ریاضی

تمرینات درس ریاض عموم ٢. r(t) = (a cos t, b sin t), ٠ t ٢π. cos ٢ t sin tdt = ka۴. x = ١ ka ۴. m ٣ = ٢a. κds باشد. حاصل x٢

4 آمار استنباطی 2 برآورد 1 فصل چهارم: آمار استنباطی


Angle Resolved Photoemission Spectroscopy (ARPES)

دانشکده ی علوم ریاضی جلسه ی ۵: چند مثال

فصل پنجم زبان های فارغ از متن

بسم اهلل الرحمن الرحیم آزمایشگاه فیزیک )2( shimiomd

جلسه 12 به صورت دنباله اي از,0 1 نمایش داده شده اند در حین محاسبه ممکن است با خطا مواجه شده و یکی از بیت هاي آن. p 1

جلسه ی ۲۴: ماشین تورینگ

6- روش های گرادیان مبنا< سر فصل مطالب

تئوری جامع ماشین بخش سوم جهت سادگی بحث یک ماشین سنکرون دو قطبی از نوع قطب برجسته مطالعه میشود.

دبیرستان غیر دولتی موحد

جلسه ی ۳: نزدیک ترین زوج نقاط

تمرین اول درس کامپایلر

آزمایش 8: تقویت کننده عملیاتی 2

هندسه تحلیلی بردارها در فضای R

جلسه 14 را نیز تعریف کرد. عملگري که به دنبال آن هستیم باید ماتریس چگالی مربوط به یک توزیع را به ماتریس چگالی مربوط به توزیع حاشیه اي آن ببرد.

تلفات خط انتقال ابررسی یک شبکة قدرت با 2 به شبکة شکل زیر توجه کنید. ژنراتور فرضیات شبکه: میباشد. تلفات خط انتقال با مربع توان انتقالی متناسب

1- مقدمه ای بر شبیه سازی< سر فصل مطالب

سلسله مزاتب سبان مقدمه فصل : زبان های فارغ از متن زبان های منظم

معادلهی مشخصه(کمکی) آن است. در اینجا سه وضعیت متفاوت برای ریشههای معادله مشخصه رخ میدهد:

فصل 5 :اصل گسترش و اعداد فازی

جلسه 2 1 فضاي برداري محاسبات کوانتمی (22671) ترم بهار

ویرایشسال 95 شیمیمعدنی تقارن رضافالحتی

ندرک درگ ندرک درگ شور

چکیده مقدمه کلید واژه ها:

Answers to Problem Set 5

جلسه 15 1 اثر و اثر جزي ی نظریه ي اطلاعات کوانتومی 1 ترم پاي یز جدایی پذیر باشد یعنی:

تحلیل الگوریتم پیدا کردن ماکزیمم

جلسه 22 1 نامساویهایی در مورد اثر ماتریس ها تي وري اطلاعات کوانتومی ترم پاییز

فهرست مطالب جزوه ی فصل اول مدارهای الکتریکی مفاهیم ولتاژ افت ولتاژ و اختالف پتانسیل تحلیل مدار به روش جریان حلقه... 22

1 دایره فصل او ل کاربردهای بسیاری داشته است. یک قضیۀ بنیادی در هندسه موسوم با محیط ثابت دایره دارای بیشترین مساحت است. این موضوع در طراحی

به نام خدا. الف( توضیح دهید چرا از این تکنیک استفاده میشود چرا تحلیل را روی کل سیگنال x[n] انجام نمیدهیم

Spacecraft thermal control handbook. Space mission analysis and design. Cubesat, Thermal control system

جلسه ی ۱۸: درهم سازی سرتاسری - درخت جست و جوی دودویی

هد ف های هفته ششم: 1- اجسام متحرک و ساکن را از هم تشخیص دهد. 2- اندازه مسافت و جا به جایی اجسام متحرک را محاسبه و آن ها را مقایسه کند 3- تندی متوسط

تئوری رفتار مصرف کننده : می گیریم. فرض اول: فرض دوم: فرض سوم: فرض چهارم: برای بیان تئوری رفتار مصرف کننده ابتدا چهار فرض زیر را در نظر

فصل سوم جریان های الکتریکی و مدارهای جریان مستقیم جریان الکتریکی

فهرست جزوه ی فصل دوم مدارهای الکتریکی ( بردارها(

جلسه 16 نظریه اطلاعات کوانتمی 1 ترم پاییز

فصل چهارم تعیین موقعیت و امتدادهای مبنا

یدنب هشوخ یاه متیروگلا

مارکوف 1.مقدمه: سید مهدی صفوی محمد میکاییلی محمد پویان چکیده ما با مطالعه مدل مخفی میدان تصادفی مارکوف از الگوریتم EM

فیلتر کالمن Kalman Filter

آموزش شناسایی خودهمبستگی در دادههای سری زمانی و نحوه رفع آن در نرم افزار EViews

جلسه 2 جهت تعریف یک فضاي برداري نیازمند یک میدان 2 هستیم. یک میدان مجموعه اي از اعداد یا اسکالر ها به همراه اعمال

مود لصف یسدنه یاه لیدبت

دانشکده علوم ریاضی دانشگاه گیلان آزمون پایان ترم درس: هندسه منیفلد 1 باشد. دهید.f (gx) = (gof 1 )f X شده باشند سوالات بخش میان ترم

فصل چهارم : مولتی ویبراتورهای ترانزیستوری مقدمه: فیدبک مثبت

اصول انتخاب موتور با مفاهیم بسیار ساده شروع و با نکات کاربردی به پایان می رسد که این خود به درک و همراهی خواننده کمک بسیاری می کند.

جلسه 28. فرض کنید که m نسخه مستقل یک حالت محض دلخواه

آشنایی با پدیده ماره (moiré)

Top Down Parsing LL(1) Narges S. Bathaeian

مدل های GARCH بوتبوتاسترپ چکیده نصراله ایرانایرانپناه دانشگاه اصفهان طاهره اصالنی گروه آمار- دانشگاه اصفهان

هدف از این آزمایش آشنایی با رفتار فرکانسی مدارهاي مرتبه اول نحوه تأثیر مقادیر عناصر در این رفتار مشاهده پاسخ دامنه

:موس لصف یسدنه یاه لکش رد یلوط طباور

3 لصف یربج یاه ترابع و ایوگ یاه ناوت

7- روش تقریب میانگین نمونه< سر فصل مطالب

جلسه دوم سوم چهارم: مقدمه اي بر نظریه میدان

مینامند یا میگویند α یک صفر تابع

نظریه زبان ها و ماشین ها

جلسه ی ۱۱: درخت دودویی هرم

عوامل جلوگیری کننده از موازی سازی عبارتند از : 1.هزینه I/O 2.هماهنگی/رقابت

بررسی اثر تبلیغات رسانه ای بر جذب مشتری بانک ها )مطالعه موردی: بانک صادرات شهرستان نیشابور(

تهیه و تنظیم : طیبه معظمی

ارزیابی بهره وری متقاطع DEA بر پایه بهبود پارتو

تعیین محل قرار گیری رله ها در شبکه های سلولی چندگانه تقسیم کد

راهنمای کاربری موتور بنزینی )سیکل اتو(

هادي ويسي. دانشگاه تهران - دانشکده علوم و فنون نوين نیم سال اول

محاسبات کوانتمی 1 علم ساخت و استفاده از کامپیوتري است که بر پایه ي اصول مکانیک کوانتم قرار گرفته است.

Transcript:

تحلیل آماری جلسه اول )جمعه مورخه 1131/70/11( سرفصل دروس: مفاهیم و تعاریف نمونه گیری و توزیع های نمونه ای برآورد کردن)نقطه ای فاصله ای( آزمون فرضیه آنالیز واریانس مدلهای خطی رگرسیون آزمون استقالل و جداول توافقی... -1 - -1-4 -5-6 -0-8 تعریف تعریف آمار : تعریف باید جامع افراد و مانع اغیار باشد. : علمی است مبتنی بر علوم ریاضی ( علمی که ریاضی بیس آن باشد از ثبات باالیی برخوردار است( که دارای 1 وظیفه است. 1- آموزش همه روشها و تکنیک های جمع آوری اطالعات)دیتا(. در روش جمع آوری اطالعات در علم آمار سه روش متدوال است. شیوه سرشماری : در این روش دولتها و آزانس های بزرگ حتی المقدور همه اطالعات موجود در یک جامعه آماری را جمع آوری می کنند.این روش مستلزم سه مورد را در اختیار ندارد)فرد( نمونه گیری : 1- زمان - هزینه 1- امکان دسترسی)اجازه دسترسی( به داده ها می باشد که یک محقق هر روشی که محققین معموال به فراوانی از آن استفاده می کنند نمونه گیری از جامعه آماری می باشد. اجازه دسترسی به بخشی)به اندازه کافی بزرگ( از اطالعات را )بصورت تصادفی( دارد که از جامعه آماری استخراج می کند. شبیه سازی هر گاه محقق به داده های واقعی دسترسی ندارد و یا اینکه نیاز ندارد از طریق شبکه نرم افزاری کامپیوتر داده های مورد نظر خود را شبیه سازی می کند. مانند روش جک نایف بوت استرپ روش ام سی و... در هر سه روش داده های جمع آوری شده را داده های خام می گویند. Raw Data.A.B.C 1

تبدیل داده های خام به داده های تراز شده یا داده های قابل تبیین به کمک تعیین شاخص های آماری و رسم گراف های آماری. )آمار توصیفی( شاخص تمایل مرکزی : ( شامل میانگین )Mea( میانه )Media( نما )Mod(. ) نمایندگی کل داده های آماری را شاخص های تمایل مرکزی نمایندگی می کنند. -.A شاخص های پراکندگی : ( شامل دامنه تغییرات) MAX-MIN ( میانگین قدر مطلق داده ها )MAD( انحراف معیار( شاخصی که میزان همگنی یا نا همگنی یا نزدیکی یا دوری داده را نسبت به شاخص مرکزی که عمدتا میانگین است نشان می دهد.( واریانس : پلی است بین صفر شدن و انحراف معیار. دامنه تغییرات : در محاسبه فقط دو مقیاس دارد بنابراین نمایندگی تغییرات را ندارد)منطق شهودی(.B 1 (x i X ) = 0 Mad = 1 میانگین قدر مطلق داده ها: X x i و همیشه برای جلوگیری از صفر شدن دو راه وجود دارد. 1- قدر مطلق و - به توان رساندن )واریانس( از واریانس برای جلوگیری از صفر شدن استفاده می شود پس باید از آن جذر بگیریم. استفاده از انحراف معیار بهتر از MAD می باشد زیرا از نظر تئوری راه باز است. شاخص های چولگی : شاخصی است که از نظر گرافیکی تقارن و یا عدم تقارن در مجموعه دیتا ها را نمایش می دهد و البته تقارن همیشه نسبت به میانگین است. هر مجموعه دیتایی که گرافش نسبت به میانگین متقارن باشد چولگی آن صفر است )پس صفر همراه شد با تقارن است( چولگی اگر مثبت باشد به راست است و اگر منفی به چپ.C توزیع نرمال استاندارد چولگی اش صفر است.

شاخص های کشیدگی( Kurtosis ) : این شاخص مانند واریانس و انحراف معیار راجع به جمع شدن شکل یا پهن بودن شکل است. کشیدگی توزیع نرمال استاندارد 1 است. مقدار کمتر از 1 باال است )Flat( و مقدار باالتر از سه پایین است )UFlat(.D 1- استنباط آماری یا آمار استنباطی در این قسمت علم آمار تحقق نتایج تحلیل آماری به کمک روشهای مختلف علم آمار را همراه با یک ضریب اطمینان به کل جامعه آماری مورد مطالعه تعمیم می دهد. جلسه دوم )جمعه مورخه 1131/70/18( تعریف جامعه آماری : populatio Statistical هر مجموعه ای از اشیاء اقالم افراد که حداقل دریک ویژگی یا یک صفت مشترک باشند. مثال جامعه آماری)کل جهان(. هر چه ویزگیها )صفات( را بیشتر کنیم)افزایش یابند( جامعه تحدید )محدود تر/ کوچکتر( می شود. جامعه آماری دانشجویان دانشگاه آزاد اسالمی جامعه آماری دانشجویان دانشگاه آزاد اسالمی استان خوزستان - - اندازه جامعه یا محدود ( متناهی ) است و یا نامحدود )نامتناهی( است. جامعه ای که اندازه آن محدود است را با N نشان می دهند. جوامع نامحدود N آنها بی نهایت ) ( است. مانند ستاره های آسمان وزن ماهی های رودخانه کارون از سرچشمه تا خلیج فارس. در یک جامعه دو ویزگی مهم وجود دارد. یک محقق این دو ویزگی را در فرضیه های پروپوزال یا پایان نامه خود مشخص کند. 1- پارامتر - متغییر -1 پارامترها در جامعه آماری : Populatio Parameters i Statiscal پارامتر در یک جامعه آماری عبارتست از هر کمیت قابل اندازه گیری ثابت و مجهول) Ukow ( مثال : نرخ بیکاری یک پارامتر است برای یک دولت. چون قابل اندازه گیری مجهول و ثابت است. نرخ تورم در استان خوزستان. متوسط وزن دانشجویان کالس. - - - 3

میانگین پول توجیبی دانشجویان کالس. واریانس قد دانشجویان کالس. واریانس IQ دانشجویان کالس. میانه فاصله خانه تا دانشگاه دانشجویان کالس. - - - - در جامعه پارامترهای زیادی وجود دارد ولی محقق بر اساس اهداف تحقیق )مساله( تعدادی از آنها را انتخاب می کند. تمرین کالسی : در زمینه تخصصی خود یک جامعه تعریف کنید و یک یا دو پارامتر آن را مشخص کنید. پارامتر را در آمار و ریاضی با حروف یونانی نشان می دهند )مانند... θ (. α,,β,λ دولتها بوسیله سرشماری پارامترها را مشخص می کنند ولی محقق به دلیل محدودیتهای سه گانه برآورد میکنند. - متغییر تصادفی. عبارت است از هر کیفیت و کمیت قابل اندازه گیری که از یک واحد جامعه به فرد دیگر همان جامعه در تغییر است. مانند : نمره درس آمار دانشجویان کالس جنسیت شهر محل سکونت گروه خونی وزن قد IQ متغیر تصادفی را با حروف بزرگ التین نشان می دهند. )مانند )T,Y,X.Z مقادیر یک متغیر را متناظرا با همان عالمت ولی بصورت کوچک نشان می دهند.)مانند )t,y,x,z به اعتبار قابل شمارش و عدم قابلیت شمارش: انواع متغیرها گسسته : متغیر گسسته شمارش پذیر است و اعداد صحیح را می پذیرد و بین دو عدد متوالی آن هیچ عددی وجود ندارد. مثال : تعداد فرزندان خانواده های دانشجویان کالس / تعداد شاغلین خانواده های دانشجویان کالس / تعداد فرزندان دختر خانواده های دانشجویان کالس/ تعداد دفعاتی که دانشجو نمره 7 آورده است / تعداد دفعاتی که از چراغ قرمز رد شده ایم. نکته: )همواره کلمه "تعداد" نشان دهنده متغیر گسسته است( پیوسته : متغیری که شمارش پذیر نیست و بین دو مقدار متوالی آن بی نهایت عدد را می توان منظور کرد. مانند وزن قد درآمد پول توجیبی مدت زمان مطالعه درس و... -1 - به اعتبار مقدار گیری یا اندازه پذیری اش : -1 کیفی : متغیر اگر بیانگر یک صفت )بیان صفت رفتار قید (در افراد جامعه باشد کیفی است )قابل شمارش نیست( ماننده گروه خون نژاد ملیت جنسیت رنگ چشم 4

-4 کمی : متغیری است اندازه پذیر که با اوزان متداول جهان قابل اندازه گیری است مانند زمان حجم وزن مساحت طول و... به اعتبار مقدار دهی : -5 مستقل : مقدار تغییرات مقادیر آن توسط محقق)آزمایشگر( تعیین می گردد )مقادیر متغیر قابل دستکاری می باشد( مانند هزینه پرداختی تبلیغات توسط محقق میزان مطالعه دانشجو برای یک درس در طول هفته. وابسته : متغیری است که تغییرات مقادیر آن متاثر از تغییرات مقادیر متغیر یا متغیرهای مستقل می باشد. مانند میزان فروش نمره درسی دانشجو و... -6 به اعتبار مقیاس اندازه گیری : در این دسته بندی هر متغیر می تواند یک یا بیش از یک ویژگی از ویژگیهای زیر را داشته باشد. هویت - اندازه و مقدار - صفر مطلق داشتن - مجاز به عملیات ریاضی بودن - -0 اسمی : Nomial دارای هویت می باشد. و متغیرهای کیفی از این نوع هستند و به راحتی در مدل بندی استفاده می شوند مانند رنگ چشم ملیت گروه خونی جنسیت. -8 ترتیبی : Ordial دارای هویت اعداد می باشند و مقدار و اندازه دارند. طیف لیکرت یک مصداق تعریف متغیرهای ترتیبی است. در این طیف 1 الی 5 را به گزینه ها اختصاص می دهند و 5 یعنی 5 برابر 1 ارزش دارد. فاصله ای : Iterval هویت دارد اندازه و مقدار دارد صفر مجازی دارد عملیات ریاضی دارد ولی بصورت محدود. درجه حرارت کلوین صفر مطلق دارد و صفر مجازی را از آنجا می آورند. -3 17 -نسبتی : Ratioal هویت مقدار صفر مطلق همه عملیات ریاضی و آماری را انجام می دهد. این متغیر دارای 4 ویژگی می باشد مانند وزن قد زمان درآمد. 5

تعریف نمونه تصادفی : Sample Radom هر زیر مجموعه ای از جامعه آماری که بطور تصادفی انتخاب می کنیم را یک نمونه تصادفی می گوئیم. محقق به دلیل محدودیت های سه گانه مجبور به استفاده از نمونه گیری است. = نمونه تصادفی نمونه گیری : Samplig با توجه به موقعیت افراد و اشیاء و اقالم یک جامعه آماری عمدتا به 4 روش نمونه گیری متدوال نمونه گیری می شوند. 1- نمونه گیری تصادفی ساده: Simple Radom Samplig هرگاه افراد جامعه از هر جهت )با توجه به اهداف و فرضیه های تحقیق( همگن باشند راحت ترین روش نمونه گیری تصادفی ساده است - نمونه گیری سیستماتیک: Systematic Samplig افراد جامعه را کد گذاری کرده و سپس یک عدد را انتخاب نموده و سایر نمونه ها را براساس مضربی از عدد انتخابی انتخاب می کنیم. مثال 5 را انتخاب می کنیم و سایر اعداد اعدام اسرای جنگی متدوال شد.,10,15,0 میشوند. این روش در جنگ جهانی زمان 1- نمونه گیری تصادفی طبقه ای : Samplig Stratificatio Radom هر گاه افراد یک جامعه ناهمگن باشند)به اعتبار اهداف تحقیق( و با توجه به اینکه ناهمگنی هم کارائی نتایج را کاهش می دهد)واریانس خطا را افزایش می دهد( بایستی این ناهمگنی را به روشی برطرف کنیم.در این حالت محقق جامعه را به چند گروه یا طبقه) K طبقه( همگن افراز می کند)مانند جنسیت سن...( آنگاه اندازه نمونه مورد نیاز را متناسب با هر گروه یا طبقه نسبت به اندازه جامعه بطور تصادفی انتخاب می کنیم. N = N 1 + N + N 3 + N 4 + + N k جامعه مورد مطالعه = 1 + + 3 + 4 + + k نمونه 1 = 1 تعداد نمونه گروه 1 N i تعداد نمونه گروه i = i N Clustrig 4- روش خوشه ای : در این روش شرایط مانند شرایط طبقه ای است ( افراد جامعه نا همگن است و آن را به طبقات همگن افراز می کنیم( اما محقق از نظر زمان و هزینه نمی خواهد از همه طبقات نمونه گیری کند. در این حالت از طبقات همگن افراز شده جامعه چند طبقه را بصورت تصادفی ساده بر می گزیند و آنگاه نمونه مورد نیاز را از این طبقات تصادفی بصورت نسبتی در طبقه ای انتخاب می کند.و همواره M<K می باشد. تعداد M خوشه به صورت تصادفی انتخاب می شود. 6

جلسه سوم دو سکشن همزمان)جمعه مورخه 1131/70/5( توزیع های نمونه ای : محقق برای بررسی درستی و یا نادرستی فرضیات خود مجبور است به دلیل محدودیت های سه گانه)زمان هزینه امکان دسترسی به اطالعات( یک نمونه تصادفی از جامعه مورد مطالعه استخراج کند. متداوال در فرضیات یک محقق در خصوص یک یا چند پارامتر ادعا کرده است. مثال ادعا کرده که همبستگی یا رابطه بین بهره وری)متغیر وابسته( و نوع مدیریت )متغیر مستقل( رابطه مثبت و باالیی است. فعالیت کالسی : یکسری مثال مرتبط با رشته بازرگانی تهیه شود مثال : نرخ تورم در منطقه A بیش از % 5 است. )مجبور به نمونه گیری هستیم( محقق بر اساس اطالعات این نمونه تصادفی شاخص های نمونه ای متناظر با شاخص های جامعه که در فرضیات او ادعا شده را محاسبه می کند. یک تفاوت بین شاخص جامعه و نمونه وجود دارد. شاخص جامعه ثابت و مجهول است )همیشه پارامتر است( اما شاخص های نمونه همگی متغیر تصادفی هستند و ثابت نیستند )با حروف التین نمایش داده می شوند(. X یک شاخص نمونه ای است )یک متغیر تصادفی(. محقق باید بین شاخص نمونه )متغیر تصادفی ) و شاخص جامعه )پارامتر است و توسط سرشماری دقیقا محاسبه میشود و یا برآورد می گردد( تمایز قائل شود. X = 1 X i = X 1, X,, X نکته : هرگاه محقق می گوید متغیر تصادفی یعنی چه توزیع S = 1 1 (X X i ) = x i X 1 احتمالی چه میانگینی چه انحراف معیاری چه واریانسی وجود دارد. واریانس باال یعنی اختالف طبقاتی زیاد است و در واقع عدالت اجتماعی کمتر. 7

مفهوم ریاضی آماری یک نمونه تصادفی چیست یک نمونه تصادفی به اندازه یک مجموعه از متغیرهای تصادفی X 1, X,, X به طوریکه 4 شرط در آن صادق باشد. توزیع یا مدل احتمال همه این متغیرهاتصادفی همان مدل یا توزیع جامعه ای است که از آن این نمونه استخراج شده است. یعنی اگر جامعه نرمال است پس توزیع هم نرمال است. میانگین این متغیرهای تصادفی میانگین همان جامعه ای است که از آن بصورت تصادفی استخراج شده است. E(X 1 ) = E(X ) = = E(X ) = μ واریانس این متغیرهای تصادفی برابر همان واریانس جامعه است. Var(X 1 ) = Var(X ) = = Var(X ) = σ این سه ویژگی همانی یا همسانی توزیع می نامند -1 - -1 X i X j i,j = 1,, 4- این متغیر های تصادفی مستقل از هم هستند. distributio( idepedet (می, idetical, نامند این چهار شرط را i.i.d و به جای اینکه بگوییم یک مجموعه که 4 شرط را دارد می گوئیم یک مجموعۀ i.i.d دو قضیه اساسی مبنای تحلیل آماری است. قضیه اساسی دقیق )تحت هر شرایط منطبق است مانند ) A=B قضیه اساسی تقریبی )غیر دقیق مجانبی( )اگر شرایط خاصی برقرار باشد A یا B بر هم منطبق می شوند( -1-1- قضیه اساسی دقیق اگر متغیر تصادفی X )مثال میزان فروش(دارای توزیع نرمال باشد به عبارت دیگر ) X ~ N,μ) σ و از این جامعه یک نمونه تصادفی)لزومی ندارد که بزرگ باشد( به اندازه استخراج کنیم و میانگین) X ( این نمونه و واریانس ( )σ این نمونه را بر اساس فرمول آنها محاسبه کنیم )تاکید : می دانیم که )X ( و ( σ( دو متغیر تصادفی هستند(آنگاه : X ~ N (μ, σ ) Z = X μ = (X μ) σ/ σ ~ (N(0, 1)) )1 نکته : هر متغیری که میانگین آن صفر باشد و واریانس آن 1 باشد می گوئیم استاندارد است و اگر نرمال باشد و استاندارد هم باشد در نتیجه نرمال استاندارد می شود. K = ( 1)S σ ~ χ ( 1) ) هرگاه خواستیم در خصوص پارامتر)شاخص( واریانس یک جامعه قضاوتی انجام دهیم از توزیع کای استفاده می کنیم. در توزیع کای چولگی به راست و مثبت است. 8

این دو متغیر X و S مستقل از هم هستند. X S T = X μ = (X μ) S/ S ~t( 1) از توزیع t به فراوانی استفاده می شود. )1 )4 در برآورد فرض از کمیت های Z,T,K استفاده می شود. و بطور کلی یک محقق با 4 کمیت محوری کار دارد. ( از کمیت F برای آزمون فرض استفاده می شود( Z نرمال استاندار T تی استودنت Z کمیت محوری دمهای) tail ( توزیع t استیودنت سنگین) tail )heavy است. مثال اگر ضریب هوشی جامعه را در نظر بگیریم احتمال تیزهوشی و منگل بودن خیلی باالست. در واقع داده های پرت lyer( out (زیادی داریم. - قضیه حد مرکزی )قضیه اساسی تقریبی( Theory) CLM(Ceteral Limit اگر X یک متغیر تصادفی )مثال میزان فروش(و دارای توزیع باشد) هر توزیعی چه گسسته و چه پیوسته( به شرطی که واریانس این توزیع متناهی باشد)بی نهایت نشود( اگر یک نمونه تصادفی بزرگ ) >30 (از این جامعه استخراج کنیم آنگاه متغیر استاندارد شده X میل می کند. و هر چه بزرگتر باشد تمایل بیشتر است. یا متغیر استاندارد شده حاصل جمع متغیرها بطور تقریب به سمت نرمال استاندارد X 1, X,, X وقتی >30 X or X i Z = X μ بطور تقریب به سمت نرمال استاندارد میل می کند σ/,0)n (1 as OR Z = x i μ σ,0)n (1 as بطور تقریب به سمت نرمال استاندارد میل می کند کمیت محوری F زمانی کاربرد دارد که محقق در گیر بیش از یک جامعه آماری باشد مثال یا 1 جامعه. در این زمان از کمیت محوریF )اف فیشر( استفاده می شود. فیشر پدر علم آمار است. مثال اگر بخواهیم میزان تورم در 11 استان کشور را بررسی کنیم از F فیشر استفاده می کنیم. 9

تولید کمیت محوری F فیشتر ) X ~ N(μ 1, σ 1 اگر 1) m : X 1, X,, X { X S 1 ) Y ~ N(μ, σ اگر ) : y 1, y,, y { y S هر دو متغیر مستقل از هم هستند X Y آنگاه کمیت محوری F فیشر به شرح زیر است : F = S 1σ S σ 1 ~ F (m و 1 1) در توزیع F فیشر و کای چولگی به راست و مثبت است برآورد کردن : برای یک محقق دانستن مقدار واقعی یک پارامتر در جامعه به دلیل محدودیت های سه گانه گفته شده امکان پذیر نیست. بنابراین بر اساس یک نمونه تصادفی که از جامعه استخراج می کند برای مقدار واقعی پارامتر مورد عالقه یک حدس )گمان( برآورد از مقادیر آن تعیین می کند. نکته : هر چه اندازه نمونه استخراجی از جامعه بیشتر باشد این مقدار تخمین یا برآورد به واقعیت نزدیکتر است اگر پارامتر مورد عالقه در جامعه θ باشد )سود ناویژه یک شرکت یا متوسط رضایت مندی شغلی کارکنان( و دسترسی به مقدار واقعی نداریم بنابراین مراجعه به برآورد می کنیم و براساس یک نمونه تصادفی که از این جامعه استخراج می کنیم شاخص نمونه ای را متناظر با شاخص جامعه بر اساس اطالعات نمونه محاسبه می کنیم. برآورد این پارامتر بر اساس این دانش را تتا هت θ می گوئیم. پارامتر )در جامعه( یک ثابت مجهول است ولی برآورد متغیر تصادفی است )چون نمونه تصادفی است(. شهودی انواع برآورد در آمار دو نوع برآورد وجود دارد 1- برآورد نقطه ای - برآورد فاصله ای 11

1- برآورد نقطه ای: برای پارامتر)مجهول( مورد عالقه تتا θ در جامعه تتا هت θ که بر اساس یک نمونه تصادفی متناظرا محاسبه می شود یک برآورد نقطه ای است. همانطوری که مشاهده می شود برای یک پارامتر ممکن است چند برآورد نقطه ای وجود داشته باشد بنابراین از بین این چند برآورد نقطه ای محقق بهترین کاراترین خوبترین را انتخاب می کند. مالک کارا بودن خوب بودن بهترین بودن دو ویژگی می باشد. ویژگی اول : نا اریبی 1- نا اریب باشد - دارای کمینه واریانس باشد. θ یک برآورد نا اریب است برای θ ˆ هر گاه یک برآوردگر θ برای پارامتر θ بطور متوسط)میانگین( بشود خود هدف مثال : آیا X )میانگین یک نمونه تصادفی( به اندازه N از یک جامعه یک برآورد نا اریب برای میانگین آن جامعه ( μ ) است مقدار اریبی 7 است = 0 μ X = 1 X i b(x, μ) = E(X ) بطور متوسط منطبق بر هدف است نا اریب E(X ) = μ E(X ) = E [ 1 X i ] = 1 E(X i) = 1 μ = 1 μ = μ هر گاه مقدار اریبی برابر با صفر شد می گوئیم این برآوردگر برای پارامتر نا اریب است. و اگر غیر صفر شود )+ -( می گوئیم اریب دارد. اریبی ضعف است و نا اریبی ویزگی مهمی است. ویزگی دوم : کمینه واریانس هر گاه برای یک پارامتر مثل θ دو برآورد گر θ 1 و θ وجود داشته باشد و هر دو نا اریب باشد یعنی باشد برآوردگر θ 1 برابر پارامتر θ یک برآوردگر var e var ˆ 1 ˆ 0 e 1 Var(θ ) کوچکتر از Var(θ 1) اگر E(θ 1) = E(θ ) = θ کارا است. سئوال : کدامیک از ویژگیهای نا اریب بودن و کمینه واریانس اولویت دارند جواب : بستگی به مساله دارد. 11

مثال : فرض کنید که دو فرد A و B تحت شرایط یکسان )حتی پارتی( می خواهند در اداره آگاهی استخدام شوند. هر دو به میدان تیر می روند و تیر اندازی می کنند. در این زمان فردی انتخاب می شود که کمینه واریانس کمتری داشته باشد. نکته : در تعریف واریانس نمونه S به جای باید 1- را قرار دهیم. S = 1 1 (X i X ) مفهوم MSE MSE = E(θ θ ) = b (θ, θ ) + var(θ ) مفهوم MSE شاخصی در آمار است که هر دو ویژگی نا اریب و کمینه واریانس را با هم دارد. MSE(θ θ ) = var(θ ) هر برآوردگری که MSE کمتری داشته باشد کاراتر است. { θ 1 θ MSE(θ 1, θ) < MSE(θ, θ) θ در نتیجه θ 1 کاراتر است و انتخاب می شود. مفهوم سازگاری یک ویزگی دیگر برای برآوردگر ویژگی سازگاری است برآوردگر θ بر اساس یک نمونه تصادفی X 1, X,, X P θ as یک برآوردگر سازگاری برای پارامتر جامعه است هر گاه : P { θ θ < ε} = 1 P { θ θ > ε} = 0 as 0 as E(θ ) = θ θ P θ as if lim var(θ ) = 0 مثال : آیا X برای μ سازگار است بله. زیرا X نا اریب است. lim var(x ) = lim σ = 0 )1 ) 1

مثال : بر اساس یک نمونه تصادفی به اندازه 17 برای یک متغیر سود ناویژه X یک برآوردگر نااریب برای متوسط سود ناویزه شرکت مورد نظر محاسبه کنید )μ( با مقادیر 1 و 1 و 5 و 6 و 0 و 8 و 1 و 15 و 18 و 7 X = 1 + 3 + 5 + 6 + 7 + 8 + 1 + 15 + 18 + 0 10 = 9. 5 S 1 = 1 (X i X ) 7. 5 + 4. 5 + 0. 5 + 1. 5 + 6. 5 +. 5 + 6. 5 + 30. 5 + 7. 5 + 110. 5 = 10 1 = 41. 61 - برآورد فاصله ای : همانگونه که از کلمه برداشت می شود محقق برای یک پارامتر مورد عالقه در جامعه یک بازه یک فاصله )نه یک نقطه و نه یک مقدار( را همراه با یک ضریب اطمینان تحت عنوان برآورد فاصله ای تعیین می کند. مثال برای پارامتر θ یک بازه,θ θ 1 همراه با یک ضریب اطمینان α 1 که α عددی است کوچک. مثال : برای متوسط هزینه های تولید یک کاال با ضریب اطمینان 35 % 177 کی% برآورد فاصله ای بصورت )134,156( واحد پول می باشد. )نکته : طول بازه و ضریب اطمینان رابطه مستقیم با هم دارند بنابراین طول بزرگ یک فاصله اطمینان کارایی ندارد. مثال با ضریب اطمینان % 177 وزن یک شهروند اهوازی بین 5 الی 157 کیلوگرم است یا با ضریب اطمینان قد یک شهروند اهوازی بین 17 الی 177 سانتی متر است( در آمار ضمن تعیین یک فاصله اطمینان کوتاه ضریب اطمینان باالیی را در نظر می گیرند. جلسه چهارم )جمعه مورخه 1131/78/7( در بحث برآورد یک پارامتر قبال یک برآوردگر تحت عنوان برآورد نقطه ای با ویژگیهای خاص از جمله نا اریبی کمینه واریانس و اکنون برای همین پارامتر در جامعه یک برآورد فاصله ای اما همراه با یک ضریب اطمینان معرفی می کنیم. در رابطه بین طول فاصله و میزان ضریب اطمینان یک رابطه مستقیم وجود دارد. با افزایش ضریب اطمینان طول فاصله افزایش پیدا می کند که متاسفانه فاصله اطمینان با طول زیاد اعتبار آماری ندارد. بنابراین در آمار ضمن اطمینان باال دنبال کوتاه ترین طول فاصله هستیم. برای یک فاصله اطمینان بصورت (1 ضریب اطمینان α)100 % و θ θ 1 (1 α) = 0. 95 α = 0. 05 ( α ) = 0. 05 D = θ θ 1 طول فاصله 13

جهت تعیین یک فاصله اطمینان برای یک پارامتر در یک جامعه این مراحل را انجام می دهیم )1 تعیین ضریب اطمینان % α)100 (1 اگردر کتابی )یا در برگ امتحان( ضریب اطمینان را ندادند هر چه خودتان دوست دارید بنویسید) 7935 معموال ( استخراج یک نمونه تصادفی به اندازه از جامعه ای که برای پارامتر آن جامعه) ) θ می خواهیم یک برآورد فاصله ای تعیین کنیم. تعیین برآورد نقطه ای برای پارامتر بر اساس نمونه تصادفی استخراج شد. )می دانیم که این برآوردگر یک متغیر تصادفی است )θ ) تعیین توزیع آماری این برآوردگر )این متغیر تصادفی θ ) بطور دقیق یا بطور تقریبی. تعیین یک کمیت محوری مناسب بر اساس نوع پارامتر مورد مطالعه توزیع برآورد )θ ) و اندازه نمونه استخراج شده از جامعه )میدانیم که تحلیل آماری کمیت های آماری F,K,T,Z را داریم( تعیین چندک های مورد نظر بر اساس توزیع کمیت محوری این چندک ها برای کمیت های محوری یاد شده) F,K,T,Z (در جداولی تحت عنوان جداول آماری توزیع های نرمال استاندارد و t استیودنت با درجه آزادی 1- خی با درجه آزادی -1 نوشتن فاصله اطمینان درخواست شده مورد نظر و توزیع F فیشر با دو درجه آزادی) صورت 1-m و مخرج 1- ) F (m-1, -1) ) )1 )4 )5 )6 )0 تعیین یک فاصله اطمینان % 100(α 1) الف( واریانس جامعه نرمال معلوم است ب( واریانس جامعه نرمال نامعلوم است برای پارامتر میانگین یک جامعه دارای توزیع نرمال الف( واریانس جامعه نرمال معلوم است X~N(μ, σ 0 ) گام اول % α)100 (1 گام دوم N = X 1, X 1,, X X = 1 N X i X = N(μ, σ ) گام سوم گام چهارم به 4 دلیل از کمیت محوری Z دقیق استفاده می کنیم. برآورد نقطه ای میانگین نمونه قضیه اساسی دقیق توزیع نرمال با میانگین Z = X μ N (X μ) = σ/ N σ 0 گام پنجم 1) N(0, ~ گام ششم : ازجدول نرمال استاندارد استفاده می کنیم 14

مقدار Z -3.60.. 0 صفر.. +3.60 1 α = 0. 95 α =. 05 α =. 05 1 α = 0. 975 رقم دوم اعشار) 0.09 --------------- 0.00( جواب کمتر از نیم جواب بیشتر از نیم مقدار Z در سطر و ستون همان چندک های توزیع نرمال استاندارد است. Z 0.975 سپس مقدار Z را از جدول توزیع نرمال استاندارد بدست می آوریم X = ±Z (1 α ) σ 0 X Z (1 α ) σ 0 D = Z Z (1 α ), X + Z (1 α σ 0 ) σ 0 = 4 σ توزیع شده باشد یک 1,,3,4,5 واحد پول X = 1 + + 3 + 4 + 5 5 μ مثال: اگر میزان درآمد شهروندان منطقه A بطور نرمال با میانگین و واریانس معلوم فاصله اطمینان % 35 برای میانگین درآمدها بر اساس یک نمونه تصادفی به اندازه 5 بصورت = 15 5 = 3 )تومان( از کمیت محوری دقیق Z کوچک است ) استفاده می کنیم چون )جامعه نرمال/ میانگین رامی خواهیم/ واریانس معلوم/ اندازه نمونه X = 3 1 α = 0. 95 15

α =. 05 α =. 05 1 α = 0. 975 Z 0.975 = 1. 96 σ 0 = 4 σ 0 = 3 ± (1. 96)/ 5 3 ± 1. 75 (1. 5, 4. 75) طول 195 می باشد موقعیت ب( در این حالت به دلیل اینکه ( جامعه نرمال برای میانگین واریانس نامعلوم و اندازه نمونه هم بزرگ نیست( در این شرایط از کمیت محوری T استیودنت با درجه آزادی 1-N استفاده می کنیم. احتمال 0.99( --------------- )0.00 چندکها درجه آزادی 1 1... 30 مثال قبل : اگر میزان درآمد شهروندان منطقه A بطور نرمال با میانگین μ و واریانس معلوم باشد یک فاصله اطمینان % 35 برای میانگین درآمدها بر اساس یک نمونه تصادفی به اندازه 5 بصورت پول )تومان( با توجه به مثال قبل فرض می کنیم واریانس معلوم نیست با توجه به درجه آزادی 4 و احتمال 79305 چندک را از جدول بدست می آوریم این فاصله به صورت زیر می باشد = 4 σ توزیع شده 1,,3,4,5 واحد N-1=5-1=4 درجه آزادی P=0.975 X ± t( 1), α S 16

با توجه به مثال قبل فرض می کنیم واریانس معلوم نیست می خواهیم فاصله % 35 برای جامعه بسازیم بنابراین از T استفاده می کنیم از جدول t استفاده می کنیم S = 1 (4 + 1 + 0 + 1 + 4) =. 5 4 واریانس نمونه S =. 5 = 1. 58 1 α = 0. 95 α = 0. 05 α = 0. 05 t 4, 0. 05 یک فاصله α) 100%(1 برای واریانس یک جامعه نرمال برای نوشتن این فاصله اطمینان به دلیل اینکه جامعه نرمال است و برای واریانس جامعه نرمال می خواهیم K برآورد فاصله ای تعیین کنیم از کمیت محوری با درجه آزادی 1- استفاده می کنیم )آزمون فرض پایان نامه( این فاصله اطمینان عبارت است از ( 1)S < σ < χα, 1 ( 1)S χ α 1, 1 S که در آن واریانس نمونه و مخرج چندکهای توزیع کای است. فاصله اطمینان برای انحراف معیار از طرفین جذر می گیریم. برای واریانس فاصله ساخته می شود و از نتیجه جذر گرفته می شود. مانند توزیع t است با این تفاوت که همه مثبت هستند = 4 σ توزیع شده مثال قبل : اگر میزان درآمد شهروندان منطقه A بطور نرمال با میانگین μ و واریانس معلوم باشد یک فاصله اطمینان % 35 برای میانگین درآمدها بر اساس یک نمونه تصادفی به اندازه 5 بصورت 1,,3,4,5 واحد پول )تومان( مثال قبل + و برای % 35 فاصله اطمینان را برای واریانس جامعه نرمال حساب می کنیم N=5 X = 3 S =. 5 1 α = 0. 95 α = 0. 05 1 α = 0. 975 17

χ 0.05 R χ 0.975 χ 0.05,4 < o < χ 0.975,4 (4) (. 5) α 1 < σ < (4) (. 5) α مقدار α 1 و α از جدول بدست می آید. جلسه پنجم )جمعه مورخه 1131/78/16( یک فاصله اطمینان (α 1)100% برای میانگین یک جامعه قضیه حد مرکزی Z تقریبی : در این حالت به دلیل اینکه نوع جامعه مورد مطالعه تعیین نشده )توزیع بیان نشده( یا حتی اگر بیان شده باشد نرمال نمی باشد برای تعیین این فاصله اطمینان)برای μ این جامعه( از قضیه اساسی دوم تحت عنوان قضیه حد مرکزی استفاده می شود. و دارای دو الزام می باشد. باید واریانس آن متناهی باشد به اندازه کافی بزرگ باشد -1 - در این حالت از کمیت محوری Z) اما Z تقریبی( استفاده می کنیم. X = 1 30 X 1, X,, X { x i S = 1 1 (x i X ) X μ X N(μ, σ ) با استفاده از قضیه حد مرکزی )زیرا توزیع مشخص نیست( و چون واریانس متناهی است و بزرگ است از توزیع Z Z = X μ N(0, 1) S/ تقریبی استفاده می کنیم. X ± Z 1 α S for μ 18

مثال : )نمونه امتحانی( برای میانگین یک جامعه یک فاصله اطمینان % 35 بر اساس یک نمونه تصادفی که اطالعات زیر از آن بدست آمده بسازید. 49 X = x i = 490 49 X = x i = 509 فرض میکنیم این جامعه دارای واریانس متناهی است)حتی اگر در مساله نیامده باشد( حجم نمونه بزرگ است زیرا 49= می باشد -1 - X = 1 (490) = 10 49 S = x i (X ) 1 s = 4 = ---------- 1 α = 0. 95 α =. 05 α =. 05 1 α = 0. 975 Z 0.975 = 1. 96 = 1 19 (509 4900) = 48 48 = 4 X ± Z (1 α ) S for μ 10 ± (1. 96) 7 (9. 44, 10. 56) یکی از مصادیق کاربرد قضیه حد مرکزی تعیین یک فاصله اطمینان برای نسبت یا احتمال موفقیت )P( در یک جامعه ای که توزیع آن دو جمله ای است. تعیین یک فاصله اطمینان 100%(α 1) برای نسبت یا احتمال موفقیت )P( در یک توزیع دو جمله ای. تعیین نرخ بیکاری تعیین نرخ تورم مقبولیت یک رفتار مدیریتی - - - 19

موارد فوق یک توزیع دو جمله ای هستند بطوری که در این فرآیند با جمعی مواجه هستیم که یا موافق هستند و یا مخالف. در فرآیندی قرار می گیریم که یک طرف هنجار و طرف دیگر ناهنجاری است. بطور کلی شکست یا موفقیت است. موفقیت مانند پیدا کردن کاالی معیوب توسط مسئول کنترل کیفیت کاال. P = X / اندازه نمونه / برآورد نقطه ای- مقبولیت P تعداد موفقیت X P ± Z α P (1 P ) 1 مثال : در کالس درس 15 نفر حضور دارند و تعداد 17 نفر از آنها از نحوه تدریس استاد راضی هستند )دارای مقبولیت درسی هستند( برای آن یک فاصله اطمینان 100%(α 1) برای نسبت یا احتمال موفقیت )P( بسازید. P ± Z α P (1 P ) 1 P = X = 10 35 = 7 --------------- 1 α = 0. 95 α =. 05 α =. 05 1 α = 0. 975 Z 0.975 = 1. 96 -------------- 7 ± (1. 96) 7 (1 7 ) 35 7 + (1. 96) 7 (1 7 ) 35 (0. 435, 0. 136) فاصله 99) (0., 7 (1. 96) 7 (1 7 ) 35 1

در موقعیت جدید تحلیلگر )محقق ) ممکن است با دو جامعه آماری درگیر شود. μ 1 μ تعیین یک فاصله اطمینان 100%(α 1) برای تفاضل میانگین های دو جامعه نرمال مستقل از هم. 1 وضعیت رخ می دهد : الف ) واریانس های این دو جامعه نرمال مستقل معلوم هستند. ب ) واریانس های این دو جامعه نرمال مستقل نا معلوم اما برابر هستند. ج ) واریانس های این دو جامعه نرمال مستقل نا معلوم و نابرابر هستند. الف ) واریانس های این دو جامعه نرمال مستقل معلوم هستند. X ~ N (μ 1, σ 1. ) دارای توزیع نرمال است با میانگین μ 1 X و واریانس مشخص σ 1. Y ~ N (μ, σ. ) دارای توزیع نرمال است با میانگین μ Y و واریانس مشخص ی. σ X Y X وY مستقل از هم هستند. یک فاصله اطمینان برای تفاضل میانگین دو جامعه نرمال m: X 1, X,, X m X = 1 m x i m : y 1, y,, y y = 1 y i μ 1 μ X Y در این حالت چون دو جامعه مورد مطالعه دارای توزیع نرمال هستند از کمیت های محوری Z یا t استفاده می کنیم. تعیین یک فاصله اطمینان 100%(α 1) برای حالت الف چون جامعه نرمال و واریانس معلوم است از کمیت محوری Z دقیق استفاده می کنیم 1

Z = (X Y ) (μ 1 μ ) σ 1. m + σ N(0, 1). (X Y ) ± Z 1 α = σ 1. m + σ. فرض کنید نمرات درس تحلیل آماری در سکشن اول بطور نرمال بصورت (4 X ~ N μ) 1, توزیع شده باشد Y ~ N (μ, 9) مثال : و نمرات در سکشن دوم بطور نرمال به صورت تفاضل میانگین های نمرات دو کالس بسازید. توزیع شده باشد. یک فاصله اطمینان % 35 برای m = 3 11, 15, 13 X = 13 = 4 19, 10, 11, 16 y = 14 --------------- 1 α = 0. 95 α =. 05 α =. 05 1 α = 0. 975 Z 0.975 = 1. 96 -------------- (13 14) ± (1. 96) 4 3 + 18 4 ( 1) ± (1. 96) 4 3 + 18 4 ( 1) ± (1. 96)(. 415) ( 3. 7334, 5. 7334 ) X ~ N (μ 1, σ 1 ) ب ) واریانس های این دو جامعه نرمال مستقل نا معلوم اما برابر هستند. و واریانس نامشخص σ 1 )بعد از اندیس 1 عالمت. )دات( حذف شده است( Y ~ N (μ, σ ) دارای توزیع نرمال است با میانگین μ 1 X و واریانس نا مشخص σ )بعد از اندیس عالمت. )دات( حذف شده است( دارای توزیع نرمال است با میانگین μ Y X Y X وY مستقل از هم هستند.

یک فاصله اطمینان برای تفاضل میانگین دو جامعه نرمال m: X 1, X,, X m X = 1 m x i m : y 1, y,, y y = 1 y i μ 1 μ X Y از کمیت محوری t استفاده می کنیم زیرا : برای میانگین ها می خواهیم تصمیم بگیریم.)می خواهیم برای تفاضل میانگین ها فاصله اطمینان مشخص کنیم( دو جامعه نرمال هستند. واریانس ها مجهول اما برابرند. -1 - -1 t = (X Y ) (μ 1 μ ) S p 1 m + 1 یک نمونه تصادفی به اندازه m از جامعه اول انتخاب می کنیم و میانگین و واریانس را مشخص می کنیم. یک نمونه تصادفی به اندازه از جامعه دوم انتخاب می کنیم و میانگین و واریانس را مشخص می کنیم. m X = 1 m x i Y = 1 x i, S 1 = x i mx m 1, S = x i X 1 S P = (m 1)S 1 + ( 1)S m + S P واریانس وزنی نمونه ها = برای برآورد نقطه ای واریانس مشترک اما مجهول σ یک برآورد نقطه ای وزنی از واریانس های نمونه ای استخراج شده از دو جامعه به صورت S P محاسبه می کنیم )تعیین می کنیم(. (X Y ) ± t (m+ ) α S 1 p 1 m + 1 برای محاسبه انحراف معیار وزنی ( p S( از ( S( P جذر می گیریم 3

مثال : برای تعیین یک فاصله اطمینان 100%(α 1) برای تفاضل میانگین های دو جامعه اطالعات زیر را داریم. m = 0 X = 15 S 1 = 16 = 30 Y = 18 S = 9 الف ) چه شرایطی برقرار باشد تا این فاصله اطمینان را محاسبه کنیم. ب ) تعیین فاصله اطمینان مورد نظر. توزیع جامعه نرمال است) چون در مساله بیان نشده است( m و کوچک هستند مستقل هستند چون مساله نگفته است واریانس های جامعه چگونه هستند فرض می کنیم برابر می باشند )هم شرایط حالت ب و هم شرایط حالت S P = (m 1)S 1 + ( 1)S m + S P = ((0 1) 16) + ((30 1) 9) 0 + 30 S P = 11. 77 = 3. 43 --------------- 1 α = 0. 95 α =. 05 α =. 05 1 α = 0. 975 (m+ ) (0+30 ) (48) t α = t0.975 = t0.975 =. 0106 1 = 11. 77 ج را دارد ولی ما حالت ب را در نظر می گیریم( (X Y ) ± t (m+ ) α S 1 p 1 m + 1 (15 18) ±. 0106 3. 43 1 0 + 1 30 ( 3) + 1. 99, ( 3) 1. 99 1. 01, 4. 99 4

ج ) واریانس های این دو جامعه نرمال مستقل نا معلوم و نا برابر هستند. X ~ N (μ 1, σ 1 ) دارای توزیع نرمال است با میانگین μ 1 X و واریانس نامشخص σ 1 )بعد از اندیس 1 عالمت. )دات( حذف شده است( Y ~ N (μ, σ ) دارای توزیع نرمال است با میانگین μ Y و واریانس نا مشخص σ )بعد از اندیس عالمت. )دات( حذف شده است( X Y X وY مستقل از هم هستند. از t تقریبی استفاده می کنیم )اما از حد مرکزی نیست( فاصله اطمینان در این حالت عبارت است از : ν (X Y ) ± t α S 1 1 m + S ν )نو )NU یک عدد صحیح است زیرا برای درجه آزادی استفاده می شود. این درجه آزادی باید به نزدیک ترین عدد صحیح گرد شود. [ S 1 m + S ] ν = ( S 1 m ) S ( m 1 + m ) 1 مثال قبل : برای تعیین یک فاصله اطمینان 100%(α 1) برای تفاضل میانگین های دو جامعه اطالعات زیر را داریم. m = 0 X = 15 S 1 = 16 = 30 Y = 18 S = 9 الف ) چه شرایطی برقرار باشد تا این فاصله اطمینان را محاسبه کنیم. ب ) تعیین فاصله اطمینان مورد نظر. جامعه نرمال است مستقل هستند واریانس های جامعه نا معلوم و نا برابر هستند از روش ج مساله حل میشود. -1 - -1 5

ν (X Y ) ± t α S 1 1 m + S [ S 1 m + S ] ν = ( S 1 m ) S ( m 1 + m ) 1 = [ 16 0 + 9 30 ] ( 16 0 ) 0 1 + ( 9 30 ) 30 1 = 0. 64 19 1. 1 0. 09 + 9 = 3. 89 33 1 α = 0. 95 α =. 05 α =. 05 1 α = 0. 975 33 (15 18) ± t 0.975 16 0 + 9 30 ( 3) ±. 0345 1. 0489 ( 3) +. 0345 1. 0489, ( 3). 0345 1. 0489 0. 866, 5. 4597 جلسه ششم )جمعه مورخه 1131/78/1( یک فاصله اطمینان 100%(α 1) برای تفاضل میانگین های دو جامعه مستقل از هم. )نرمال حذف شده و N بزرگ است( چون این دو جامعه نوع توزیع آنها معلوم نیست بنابراین برای نوشتن یک فاصله اطمینان جهت تفاضل میانگین ها در قضیه حد مرکزی استفاده می کنیم. x ~ (μ 1, σ 1 ) y ~ (μ, σ ) x y برای μ 1 μ یک فاصله اطمینان α)100% (1 تعیین می کنیم. m بزرگ 1( x 1, x, x m { x = 1 m s 1 = x i 1 m m 1 (x i x ) بزرگ) y 1, y,.. y { y s 6

X Y μ 1 μ در این حالت با استفاده از قضیه حد مرکزی کمیت محوری Z را داریم Z = می خواهیم یک فاصله اطمینان 35 درصد برای رضایتمندی دو سازمان مستقل از هم بسازیم برای این منظور دو نمونه تصادفی بزرگ از این دو سازمان استخراج کرده و نتایج زیر حاصل شده براساس این نتایج این فاصله به صورت زیر است. 1( m = 40 x = 85 s 1 = 18 ( = 50 y = 75 s = 1 1 α = 95 α = 0. 05 1 α = 0. 975 z 0. 975 = 1. 96 85 75 ± (1. 96) 18 40 + 1 50 یک فاصله اطمینان 100%(α 1) برای تفاضل نسبت ها یا تفاضل احتمال موفقیت ها در دو توزیع دو جمله ای مستقل از هم x ~ Bi (m, p 1 ) y ~ Bi (, p ) x y برای p 1 p یک فاصله اطمینان α)%100 (1 تعیین می کنیم با اینکه توزیع هر جامعه معلوم است اما نرمال نیست در این حالت نیز از قضیه حد مرکزی استفاده می کنیم. یک نمونه تصادفی از جامعه اول m را استخراج می کنیم. m x 1, x,. x m تعداد موفقیت ها X p 1 = x m یک نمونه تصادفی در جامعه دوم را استخراج می کنیم. y 1, y,. y تعداد موفقیت ها y p = y 7

p 1 p p 1 p این فاصله اطمینان به شرح زیر است p 1 p ± z 1 α p 1(1 p 1) + p (1 p ) m برای مقبولیت شیوه های رهبری مشارکتی و آمرانه در دو سازمان براساس نظر سنجی انجام شده اطالعات در زیر حاصل شده در سازمان 1 m = 100 x = 95 در سازمان = 150 y = 50 p 1 = 95 = 0. 95 100 p = 50 150 = 1 = 0. 33 3 z = 0. 975 = 1. 96 (0. 95)(1 0. 95) (0. 95 0. 33) ± (1. 96) 100 (0. 33)(1 0. 33) + 150 مثال : 1- یک فاصله اطمینان %100(α 1) برای میانگین تفاوتها دردو جامعه وابسته. در این موقعیت در واقع تحلیل گر یا محقق با یک جامعه در دو موقعیت درگیر است مثال نظر سنجی افراد از نظر شیوه رهبری قبل از آموزش خدمت و نظر سنجی از افراد از نظر شیوه رهبری بعد از آموزش خدمت - میزان فروش یک کاال قبل از یک سری تبلیغات برای فروش و میزان فروش همین کاال بعد از یک سری تبلیغات به داده های اینگونه مسائل در آمار داده های جفت شده می گویند. در این حالت تفاوت را 8

X قبل از... Y بعد از... D = X Y x 1 x... x y 1 y... y D 1 = x 1 y 1 D = x y... D = x y D = 1 D i s D = 1 1 (D i D D~N(μ D, σ D ) ) 1( ( 1) D ± t 1 α s D در این حالت از کمیت محوری t استفاده می کنیم. تبصره مهم : اگر y, x نرمال نباشد و بخواهیم برای میانگین تفاوت ها یک فاصله اطمینان %100(α 1) بسازیم s D D ± Z 1 α ( اندازه نمونه را بزرگ می گیریم و از قضیه حد مرکزی استفاده می کنیم ) و از فرمول زیر استفاده می کنیم مثال : برای تعیین فاصله اطمینان %95 جهت میانگین تفاوتها در یک سازمان از نظر رضایتمندی قبل از غنی سازی شغلی و بعد از غنی سازی شغلی نتایج زیر برای 17 فرد سازمان به صورت زیر است چون نمونه کم است فرض می کنیم رضایتمندی در دو حالت نرمال است y بعد از غنی سازی شغل X قبل از غنی سازی شغل 5 8 3 4 3 17 1 4 8 8 0 17 6 3 8 5 4 4 3 D D 1 = x 1 y 1 = 5 8 = 3 D = 7 8 = 1 D 3 = 9 10 = 1 D 4 = 4 6 = D 5 = 9 9 = 0 D 6 = 10 8 = D 7 = 3 5 = D 8 = 4 = D 9 = 4 4 = 0 D 10 = 8 9 = 1 3 1 1 4 7 4 4 4 7 1 D D = 0. 5 9

1 D i 10 D i = 8 s D = s D = 1. 68 8 10(0. 8) 9 1. 68 (0. 05) ± 1. 96 10 = 5. 5 9 =. 83 یک فاصله اطمینان %100(α 1) برای نسبت واریانس های دو جامعه مستقل از هم x ~ (μ 1, σ 1 ) y ~ (μ, σ ) x y σ 1 α)%100 (1 برای σ یک فاصله اطمینان از جامعه اول یک نمونه تصادفی به اندازه m استخراج می کنیم m x 1, x,. x m { x s 1 از جامعه دوم یک نمونه به اندازه استخراج می کنیم y 1, y. y { y s F = s 1 σ s σ 1 ~ F (m 1, 1) F α s 1 s (m 1, 1) < σ 1 σ < s 1 s (m 1, 1) F α مثال : یک فاصله اطمینان %95 برای نسبت واریانس های میزان بهره وری در دو سازمان,B A براساس اساس اطالعات زیر بنویسید 5 5 x i = 30, x i = 190 31

4 4 y i = 8, y i = 199 الف ) برای نوشتن این فاصله اطمینان چه فرضهایی الزم است ب( این عددها را مشخص کنید باید دو جامعه نرمال و مستقل باشند. با در نظر گرفتن این دو فرض مسئله را حل می m = 5 x = 30 5 = 6 = 4 y = 8 4 = 7 s 1 s =. 5 1 =. 5 کنیم. s 1 = s = 190 (5)(36) =. 5 4 199 (4)(49) 3 = 1 بقیه اطالعات از جدول F فیشر بدست می آید و در فرمول قرار می دهیم..5 1 (4,3) F 0.05 اگر بخواهیم برای نسبت انحراف معیار دو جامعه یک فاصله اطمینان بسازیم σ به σ تبدیل می شود آزمون فرضیه فرضیه : ادعایی است که در خصوص پارامترهای یک جامعه آماری که تاکنون درستی یا نا درستی آن اثبات نشده است و غیر قطعی است. در بحث استنباط آماری در قسمت آزمون فرضیه دو فرضیه وجود دارد : فرضیه صفر که با فرض مقابل که با H 0 نشان داده می شود H 1 نشان می دهیم -1 - که در یک مسئله آزمون فرضیه همیشه عین ادعای مدعی را در فرض مقابل جای می دهند مثال : بین توانمندسازی کارکنان و رضایت مشتری ارتباط وجود دارد = 1 H H 1 ρ x,y > 0 31

در فرضیه صفر خالف ادعای مدعی را می نویسیم همراه با اصل بر برائت.در واقع می نویسیم: بین توانمندسازی کارکنان و رضایت مشتری ارتباط وجود ندارد.= H 0 H 0 ρ = 0 جلسه ششم )جمعه مورخه 1131/78/17( در تقابل بین واقعیت مجهول)مشخص نیست که H 0 درست است یا خیر( و نوع تصمیم گیری) رد یا عدم رد ) H 0 در آزمون فرضیه 4 رویداد اتفاق می افتد. H 0 H 0 H 0 درست است خطای نوع اول رد می شود - H 0 درست نیست - خطای نوع دوم رد نمی شود پس از انجام آزمون فرضیه همواره محقق درگیر دو نوع خطا است. خطای نوع اول : عبارتست از رد کردن H 0 در صورتی که H 0 درست است. خطای نوع دوم : عبارتست از رد نکردن H 0 در حالیکه H 0 درست نیست. برای بهتر روشن شدن این رویدادها این نوع خطاها و همچنین انجام درست آزمون را به زبان احتمال بیان می کنیم. α = P {I {نوع = P { رد میشود H 0 است Hدرست 0 } β = P {II {نوع = P { رد نمیشود H 0 نیست Hدرست 0 } احتمال خطای نوع اول احتمال خطای نوع دوم احتمال رویداد H 0 یا انجام درست آزمون } 0 Hدرست نیست 0 H رد میشود { P = } انجام درست آزمون} β = P 1 درگیر دو خطا هستیم و کنترل هردو با هم ممکن نیست چون احتمال است و جمع احتمال γ = 1 β γ = 1 β 1 می شود. در آزمون فرضیه برای این مشکل )هم زمان کنترل کردن خطای نوع اول و دوم ) خطای نوع مهمتر را از پیش با مراجعه کننده )متقاضی( مشخص می کنیم. خطای نوع اول مهمتر است )سطح معنی داری آزمون( و هر چه متقاضی ریسک پذیر 3

باشد این مقدار بزرگ می شود.. سطح معنی داری آزمون که در کتابها معموال 5 درصد گرفته میشود بین 7 تا 17 درصد در نوسان است )به اشتباه اصل به براعت رد می شود= خطای نوع اول( چرا خطای نوع اول از خطای نوع دوم بیشتر است فرض کنید یک تولید انبوه در گارانتی یا مدیریت تولید بیان کرده که نرخ )درصد( کاالی معیوب در خط تولید 5 درصد است ( 0.05 ) H 0 = θ یک مدیریت تولید یا سازنده خط تولید ادعا دارد که سیستمی ساخته است که این درصد کاالی معیوب را از 5 درصد به 1 درصد می رساند. خطای نوع اول اهمیت بیشتری دارد زیرا هزینه باالیی دارد ولی در خطای نوع دوم فرصت را از دست می دهیم. اگر خطای نوع اول کم شود توان آزمون افزایش پیدا می کند. β γ = 1 با افزایش حجم نمونه خطای نوع دوم کم میشود. سطح معنی داری آزمون : میزان ریسکی است که متقاضی می پذیرد به اشتباه فرضیه صفر )اصل بر برائت ) رد شود. گامهای آزمون فرضیه : تعیین سطح معنی داری آزمون ( اگر در امتحان ذکر نشد = 0.05 α است ) نوشتن فرضیه ها )فرض اول - فرض مدعا( -1 - )H 0 PH = 7 مثال : متخصص محیط زیست می گوید آب شرب اهواز سالم نیست ( فرض : آب سالم است H 0 بهره وری در سازمان آب رضایت بخش نیست. ( فرض : بهره وری رضایت بخش است( H 0 استخراج یک نمونه تصادفی به اندازه کافی بزرگ از جامعه آماری هدف که روی آن یا پارامترهای آن قضاوت انجام گرفته است. برآورد پارامتر مورد ادعا براساس اطالعات در مجموعه داده های نمونه تصادفی ( متوسط PH هزار خانه را به عنوان متوسط PH آب اهواز اعالم میشود( تعیین توزیع برآوردگر نقطه ای پارامتر به طور دقیق یا تقریبی تعیین یک کمیت محوری Z دقیقی Z تقریبی t دقیق t تقریبی F دقیق K دقیق ) تعیین ناحیه ای تحت عنوان ناحیه بحرانی در علم آمار. )ناحیه بحرانی ناحیه ای است که در آن به اشتباه یا به درستی فرضیه H 0 )فرضیه اصل بر برائت( رد میشود ) تصمیم گیری ( تصمیم گیری محتاطانه است قاطعانه نیست( بر اساس سطح معنی داری تعیین شده و اندازه نمونه استخراج شده و مساله مکانی و زمانی. -1-4 -5-6 -0-8 پایان تصمیم گیری منتج به نظریه نمی شود. 33

نظریه : ادعایی است که کسی خالفش را ثابت نکرده فرضیه : درستی یا نادرستی آن در این شرایط معلوم نیست. انواع فرضیه : فرضیه ساده : فرضیه ای است که در آن پارامتری که رویش ادعا شده فقط یه مقدار را می گیرد مانند PH=7 ( پس همیشه سعی می کنیم که فرض H 0 را به شکل یک فرضیه ساده بنویسیم ) فرضیه مرکب : فرضیه ای است که پارامتر درآن فرضیه بیش از یک مقدار را می گیرد. < 7 PH H 1 : -1 - فرضیه مقابل دو گونه است : یک دامنه : مانند PH<7 دو دامنه : مانند PH 7-1 - دامنه راست )<0( دامنه چپ )0>( دو دامنه 0 θ آزمون فرضیه در سطح معنی دار α برای میانگین یک جامعه نرمال الف ) واریانس جامعه معلوم ب( واریانس جامعه نا معلوم الف ) واریانس جامعه معلوم X~ N(μ, σ 0 ) سه دسته اتفاق برای میانگین 1- H 0 μ μ 0 H 1 μ < μ 0 - H 0 μ μ 0 H 1 μ > μ 0 3- H 0 μ = μ 0 H 1 μ μ 0 : X 1, X,, X = { X = 1 X i} X~ N (μ, σ 0 ) از کمیت Z دقیق استفاده می کنیم زیرا : جامعه نرمال است واریانس معلوم است برای میانگین آزمون فرض می کنیم. همیشه مقدار Z تحت قبولی فرض H 0 نوشته می شود. 34

Z H0 = X μ0 σ0 : برای فرضیه 1 1- ناحیه بحرانی : If Z H1 < Z α The ردکن Re H 0 )نقطه بحرانی Z α ) - تک دامنه سمت چپ نمودار If Z H0 > Z α The ردکن Re H 0 3- If Z H0 > Zα The ردکن Re H 0 تک دامنه سمت راست نمودار دو دامنه مثال : ادعا شده است که میانگین درآمد سرانه یک شهر 7 واحد پول نمی باششد. در سطح معنی داری α این ادعا را بررسی کنید. فرض می شود واریانس درآمد ها برابر 4 واحد پول است. قبل از آزمون چه فرضی روی این جامعه بایستی اعمال شود درآمد سرانه افراد در این شهر از یک توزیع نرمال پیروی می کند. = 5.13.15..30 5 X = X i = 105 5 = 1 H 0 = μ = 0 1 0 Z H0. / 5 = 5 = 1.05 Zα و ادامه دارد... = 1.96 35

ب( واریانس جامعه نا معلوم X نرمال است ولی واریانس معلوم نیست. سطح معنی داری 5 درصد است. سه دسته حالت فرضیه اول برقرار است. 1- H 0 μ μ 0 H 1 μ < μ 0 - H 0 μ μ 0 H 1 μ > μ 0 3- H 0 μ = μ 0 H 1 μ μ 0 یک نمونه تصادفی انتخاب می کنیم و عالوه بر X مقدار S را حساب می کنیم )زیرا واریانس نامشخص است( از کمیت t استفاده می شود زیرا : نمونه کوچک است جامعه نرمال است میانگین مورد نظر است واریانس نامعلوم است. t H0 = X μ 0 S/ If t α 1 the Re H 0 IF t H0 > t α 1 the Re H 0 IF t H0 < t α 1 the Re H 0 مثال : اگر در مثال قبل واریانس نامعلوم باشد) 4 نباشد( این ادعا که میانگین درآمد سرانه کمتر از 7 واحد پولی است را در H 0 = μ = 0 H 1 = μ < 0 X = 1 S = 49.5 S = 7.03 سطح معنی دار 5 درصد و داده های مثال قبل حل کنید. 36

مساله : آزمون فرض در سطح معنی دار α برای میانگین یک جامعه در این مساله چون نوع توزیع معلوم نیست و برای میانگین می خواهیم آزمون فرضیه انجام بدهیم با استخراج یک نمونه تصادفی بزرگ )30<N( از کمیت محوری Z تقریبی )با استفاده از قضیه حد مرکزی( استفاده می کنیم. در این حالت نیز فرضیه ها روی میانگین مانند قبل است. 1- H 0 μ μ 0 H 1 μ < μ 0 - H 0 μ μ 0 H 1 μ > μ 0 3- H 0 μ = μ 0 H 1 μ μ 0 ناحیه بحرانی و نمودارها مانند حالت الف است Z H0 = X μ S مثال : ادعا شده است که متوسط نمره درس تحلیل آماریدر این دانشکده بیشتر از 14 است. براساس یک نمونه تصادفی استخراج شده از این جامه آماری اطالعات زیر را داریم: 30 X i = 450 30 (X i ) = 6866 = 30 X = 450 30 = 15 S = 6866 30(15) 9 = 4 Z H0 = X μ S = 15 14 30 = 30 =.73 چون > 1.96.73 است فرض صفر رد میشود. 37

آزمون فرضیه برای سطح معنی دار α موفقیت ) در یک توزیع دو جمله ای. برای نسبت یا سطح موفقیت در یک توزیع دو جمله ای برای P )احتمال مانند میانگین سه فرضیه داریم 1- H 0 P P 0 H 1 P < P 0 - H 0 P P 0 H 1 P > P 0 3- H 0 P = P 0 H 1 P P 0 علی رغم معلوم بودن نوع توزیع جامعه که دو جمله ای است و نرمال نیست از قضیه حد مرکزی استفاده می کنیم و دوباره از کمیت محوری Z تقریبی برای تصمیم گیری استفاده می کنیم. کمیت محوری برای هر سه دسته عبارت است از : Z H0 = P P 0 P 0(1 P 0 ) تصمیم گیری ناحیه بحرانی مانند حالت الف در حالت نرمال است. X ادعا می کند که مقبولیت شیوه مدیریتی مشارکتی در یک شرکت بیشتر از % 85 است. این ادعا را در سطح موافقین = 10000 X = 9500 H 0 P = 0.85 مثال : آقای معنی دار 5 درصد و اطالعات زیر از یک نمونه تصادفی آزمون کنید. H 1 P > 0.85 P = 9500 10000 = 0.95 Z H0 = Z H0 > 1.96 P P 0 P 0(1 P 0 ) = 95 85 0.85(0.15) 10000 =.80 چون 1.96.80 است فرض صفر رد میشود. 38

جلسه هفتم تشکیل نشد جلسه هشتم )جمعه مورخه 1131/73/0( )جمعه مورخه 1131/73/14( آزمون فرض در سطح معنی دار برای مقایسه میانگین های دو جامعه نرمال مستقل از هم الف ) واریانس دو جامعه معلوم ب( واریانس دو جامعه نا معلوم اما برابر ج( واریانس دو جامعه نا معلوم و نا برابر تاکنون آزمون فرضیه در خصوص میانگین یک جامعه نرمال و میانگین یک جامعه با توزیع نامعلوم و احتمال موفقیت در یک توزیع دو جمله ای مسائل مربوط به آزمون فرضیه را مورد مطالعه قرار داده ایم اینک در موقعیتی هستیم که برای میانگین های دو جامعه نرمال و دو جامعه غیر نرمال می خواهیم آزمون فرضیه انجام دهیم. الف ) واریانس دو جامعه معلوم X~N(μ 1, σ 1 ) Y~N(μ, σ ) X Y برای مقایسه میانگین های دو جامعه 1 ادعا می توان کرد 1) { H 0 : μ 1 μ H 1 : μ 1 < μ ) { H 0 : μ 1 < μ H 1 : μ 1 μ 3) { H 0 : μ 1 = μ H 1 : μ 1 μ ادعا 1 ادعا ادعا 3 به 1 دلیل کمیت محوری برای اجرای آزمون فرضیه Z دقیق است هر دو توزیع نرمال هستند واریانس هر دو جامعه مشخص است برای مقایسه میانگین های این دو جامعه می خواهیم آزمون انجام دهیم )1 ) )1 m x 1, x, x 3,.., x x y 1, y, y 3,., y y μ 1 = μ μ 1 μ = 0 39

ناحیه بحرانی و نوع تصمیم گیری برای این حالت دقیقا جامعه نرمال است مشابه ناحیه بحرانی و نوع تصمیم گیری در حالت )الف( یک Z H 0 = (X Y ) 0 σ 1 m + σ مثال : فرض کنید که میزان عملکرد کارکنان دو سازمان A,B )مستقل( دارای توزیع نرمال با مقادیر واریانس به ترتیب 4 و 3 باشد براساس نمونه های زیر این ادعا که میانگین عملکرد این دو سازمان متفاوت هستنددر سطح معنی m x 1 = 1, x = 18, x 3 = 14, x 4 = 16 x = 60 4 = 15 y 1 = 10, y = 0, y 3 = 11, y 4 = 10, y 5 = 9 y = 60 5 = 1 { H 0 : μ 1 = μ H 1 : μ 1 μ X~N(μ 1, 4) Y~N(μ 1, 9) دار = 0. 05 α آزمون کنید. Z H 0 = (15 1) 0 4 4 + 9 = 5 3 = 1. 79 1. 67 اگر if a > 1. 96 The Rej H 0 چون 1903 بزرگتر از 1936 می باشد پس فرض H 0 رد میشود ب( واریانس دو جامعه نا معلوم اما برابر X~N(μ 1, σ ) Y~N(μ, σ ) در این حالت مانند حالت الف روی میانگین های این دو جامعه 1 دسته فرضیه حالت )الف( برقرار است اما به 4 دلیل در این حالت کمیت محوری t استیودنت دقیق استفاده می کنیم. 1- توزیع دو جامعه نرمال - واریانس جامعه ها معلوم نیست 1- برای مقایسه میانگین های دو جامعه آزمون فرض انجام می شود. 4- اندازه نمونه های بزرگ نیستند. 41

1) { H 0 : μ 1 μ H 1 : μ 1 < μ ) { H 0 : μ 1 < μ H 1 : μ 1 μ 3) { H 0 : μ 1 = μ H 1 : μ 1 μ ادعا 1 ادعا ادعا 3 این کمیت برای هر 1 دسته فرضیه عبارت است از : t H 0 = (X Y ) 0 Sp 1 m + 1 Sp = (m 1)s 1 + ( 1)s m + Sp = Sp ناحیه بحرانی و نوع تصمیم گیری برای این حالت دقیقا مشابه حالت )ب( یک جامعه نرمال است با این تفاوت که در آنجا )یک جامعه ) درجه آزادی 1 بود ولی اینجا درجه آزادی ( m) + می باشد. مثال : براساس اطالعات مثال قبل این ادعا که میانگین عملکرد سازمان A کمتر از میانگین عملکرد سازمان B در H 0 : μ 1 μ H 1 : μ 1 < μ X = 15 Y = 1 سطح معنی دار =.0 05 α برآورد کنید. )واریانس دو سازمان نامعلوم اما برابر باشد( S 1 = 1 3 (9 + 9 + 1 + 1) = 0 3 S = 1 8 ( 4 + 64 + 1 + 4 + 9) = 4 4 = 41 = 0. 5 Sp = (m 1)s 1 + ( 1)s m + Sp = Sp = 14. 57 = 3. 81 0 8 3 = 3 + 4 4 = 14. 57 4 + 5 t H 0 = (X Y ) 0 = Sp 1 m + 1 (15 1) 0 = 1. 40 3. 18 1 4 + 1 5 (7) if 1. 40 < t 0.05 The Rej H 0 (7) ) t 0.05 کوچکتر است پس فرض H 0 رد می شود. چون 1947 از ( 198346 41

ج( واریانس دو جامعه نا معلوم و نا برابر X~N(μ 1, σ 1 ) Y~N(μ, σ ) X Y برای این 1 دسته فرضیه گفته شده در )الف( برقرار است 1) { H 0 : μ 1 μ H 1 : μ 1 < μ ) { H 0 : μ 1 < μ H 1 : μ 1 μ 3) { H 0 : μ 1 = μ H 1 : μ 1 μ ادعا 1 ادعا ادعا 3 کمیت محوری برای اجرای آزمون فرض عبارتست از کمیت محوری تقریبی t دو جامعه نرمال هستند واریانس هر دو جامعه نامعلوم نابرابر می باشد اندازه دو جامعه کوچک می باشد برای میانگین های دو جامعه می خواهیم آزمون کنیم -1 - -1-4 t H 0 = (X Y ) 0 S 1 m + S t υ v = ( s 1 m ) (m 1 ) ( s 1 m + s ) + ( s ) 1 ( ) ( ) این عدد را به نزدیک ترین عدد صحیح گرد می کنیم. جای ناحیه بحرانی و نوع تصمیم گیری در این حالت مشابه حالت )ب( )دو جامعه( می باشد با این تفاوت که درجه آزادی به υ می باشد و آنجا t دقیق و اینجا t تقریب است. (m + ) 4

مثال : با توجه به مثال 1 اگر میزان عملکرد در دو سازمان دارای توزیع نرمال باشند در سطح معنی دار =.0 05 α و اطالعات موجود در مثال دوم این ادعا که میانگین عملکرد در سازمان A به اندازه حداقل 5 واحد بیشتر از میانگین ( μ 1 μ = 5) H 0 : μ 1 μ + 5 H 1 : μ 1 > μ + 5 عملکرد B است را آزمون فرض کنید دو توزیع نرمال هستند درباره واریانس اظهار نظر نشده ( پس نامعلوم نابرابر است( -1 - بنابراین از کمیت t تقریبی استفاده می شود t H 0 = (X Y ) 5 (15 1) 5 S 1 m + S = = = 0. 83 0 8. 40 3 4 + 4 5 1 1 v = ( 0 3 4 1 + 8 4 ) 5 1 = ( (0 3 ) 4 1 ) + ( (8 4 ) 5 1 ) 33. 54 = 0. 77 119. 87 if 0. 83 > t a v The رد نمی شود H 0 درجه آزادی v است نه ) (m + 43

آزمون فرض در سطح معنی دار α برای مقایسه میانگین های دو جامعه مستقل از هم )نرمال حذف شده( نوع توزیع های دو جامعه معلوم نیست بنابراین قضیه حد مرکزی مورد توجه قرار می گیرد. اگر اندازه بزرگ بود مساله قابل حل است در غیر اینصورت قابل حل نیست فرضیه های گفته شده در الف ب ج نیز برقرار است 1) { H 0 : μ 1 μ H 1 : μ 1 < μ ) { H 0 : μ 1 < μ H 1 : μ 1 μ 3) { H 0 : μ 1 = μ H 1 : μ 1 μ ادعا 1 ادعا ادعا 3 - - - X~ (μ 1, σ 1 ) Y~ (μ, σ ) در این حالت به 1 دلیل از کمیت محوری Z تقریبی استفاده توزیع مشخص نیست برای میانگین دو جامعه می خواهیم آزمون فرض انجام دهیم اندازه نمونه ها بزرگ باشد -1 - -1 z H 0 = (X Y ) 0 N (0, 1) S 1 m +S منطقه A کوچکتر از درآمد سرانه در منطقه B است. در سطح مثال : ادعا شده است که متوسط درآمد سرانه در معنی دار 05 =.0 α این ادعا را با استفاده از اطالعات موجود در دو نمونه تصادفی دو منطقه مذکور بصورت زیر بررسی کنید. توزیع های درآمد سرانه در این دو منطقه مشخص نشده است بنابراین برای اجرای این آزمون باید اندازه نمونه بزرگ باشد. نمونه ها بزرگ هستند. -1-50 X i = 600 50 (X i ) = 649 44

40 Y i = 440 40 (Y i ) = 4917 X = 600 50 = 1 Y = 440 40 = 11 S 1 = S = 649 50(144) 49 4918 40(11) 39 = = 1 H 0 : μ 1 μ H 1 : μ 1 < μ z H 0 = (1 11) 0 50 + 1 = 3. 9 40 رد نمی شود if 3.9 < 1.64 The H 0 آزمون فرض در سطح معنی دارα برای مقایسه نسبت ها یا احتماال موفقیت در دو توزیع دو جمله مستقل از هم توجه : در این حالت توزیع دو جامعه مورد مطالعه معلوم است اما نرمال نیست بنابراین بایستی با استفاده از قضیه حد X~Bi (m 1, p 1 ) Y~Bi(, p ) X Y مرکزی از کمیت محوری z تقریبی به شرط اندازه های نمونه های بزرگ استفاده کنیم در این حالت مانند مقایسه μ 1, μ سه دسته فرضیه وجود دارد. 1) { H 0 : p 1 p H 1 : p 1 < p ) { H 0 : p 1 < p H 1 : p 1 p 3) { H 0 : p 1 = p H 1 : p 1 p ادعا 1 ادعا ادعا 3 کمیت محوری در این حالت z تقریبی است با این شرط که بزرگ باشد 45

z H 0 = p 1(1 p 1) m (p 1 p ) 0 + p (1 p ) p 1 = x m p = y تعداد موافقین x m تعداد موافقین y باشد. مثال ناحیه بحرانی و نوع تصمیم گیری در این حالت )بطور تقریبی( مانند حالت )الف( در یک جامعه و دردو جامعه می : ادعا شده است که مقبولیت نوع مدیریتی مشارکتی در سازمان A بزرگتر از مقبولیت نوع مدیریت مشارکتی A m = 100, x = 900 در سازمان B است در یک در نظر سنجی از این دو سازمان اطالعات زیر بدست آمده B = 1000, y = 800 مقبولیت / نظر سنجی نشان می دهد که نوع توزیع در هر دو جمله ای است. H 0 : p A p B H 1 : p A > p B p 1 = p = 900 100 = %75 800 1000 = %80 z H 0 = (%75 %80) %75(%5) 100 + %80(%0) 1000 = 0. 05 = 0. 393 0. 17 رد نمی شود H 0 64 > 1. 393 0. 46

آزمون فرض در سطح معنی دارα برای میانگین تفاوتها در دو جامعه نرمال وابسته )داده های جفت شده( در این مساله در واقع یک جامعه در واقع یک جامعه در دو موقعیت متفاوت که به عنوان دو جامعه وابسته تلقی می شود. در این حالت موقعیت اول را قبل می گوییم. X قبل از... x 1 x... x Y بعد از... y 1 y... y D = X Y D 1 = x 1 y 1 D = x y... D = x y D~N(μ D, σ 1 ) 1) { H 0 : μ D μ 0 H 1 : μ D < μ 0 ) { H 0 : μ D < μ 0 H 1 : μ D μ 0 3) { H 0 : μ D = μ 0 H 1 : μ D μ 0 s D = 1 1 (D i D ) استیودنت با درجه آزادی 1 Tدقیق D تفاوت x و y ها نرمال است واریانس D معلوم نیست اندازه نمونه بزرگ نیست -1 - -1 مثل حالت )ب( یک جامعه نرمال جلسه هفته پیش اگر در اینگونه مسائل )جفت شده( اندازه نمونه های داده های جفت شده به اندازه کافی بزرگ باشد و نوع توزیع معلوم نباشد با استفاده از قضیه حد مرکزی می توان برای آزمون هرگونه فرضیه برای μ D z استفاده کرد. و ناحیه بحرانی و نوع تصمیم گیری مثل حالت )الف( در یک جامعه نرمال است. مثال از کمیت محوری غیر دقیق : برای آزمون اثر بخش ضمن خدمت روی عملکرد کارکنان یک سازمان اطالعات قبل از آموزش و بعد از آموزش برای 5 نفر بصورت زیر در دست داریم. این ادعا که آموزش ضمن خدمت روی عملکرد کارکنان تاثیر منفی دارد را در سطح معنی داری =.0 05 α بنویسید ضمنا قبل از اجرای آزمون فرضیه برای این آزمون چه شرط هایی الزم است. 47

X 8 0 0 5 1 y 17 8 0 4 5 D = x y 1 0 1 H 0 : μ D 0 H 1 : μ D < 0 شرط الزم : عملکرد کارکنان قبل از و بعد از آموزش دارای توزیع نرمال باشد. چون اندازه نمونه کوچک است t H 0 = D μ 0 S D D = 4 5 S D= = 0. 8 ~ t 1 حل در منزل 48

آزمون فرض در سطح معنی داری α برای واریانس یک جامعه نرمال X~N(μ 1, σ ) برای پارامتر واریانس در این جامعه 1 دسته فرضیه وجود دارد 1) { H 0 : σ σ 0 H 1 : σ < σ 0 χ H 0 < χ ( 1) 1 α Rej H 0 ) { H 0 : σ σ 0 H 1 : σ > σ 0 χ H 0 > χ α ( 1) Rej H 0 3) { H 0 : σ = σ 0 H 1 : σ σ 0 χ H 0 < χ ( 1) α 1 or χ H 0 > χ ( 1) α Rej H0 در این حالت چون جامعه نرمال است و برای پارامتر واریانس می خواهیم آزمون فرض انجام دهیم از کمیت محوری کای استفاده می کنیم χ H 0 ( 1)s σ 0 χ ( 1) با درجه آزادی 1 1 α کوچکتر از H 0 ناحیه بحرانی شود و نوع تصمیم گیری : اگر این مقدار کای تحت فرض H 0 رد میشود. مثال : ادعا شده است که نوسانات قیمت فروش یک کاال بیش از 5 واحد پول است اگر میزان فروش این کاال دارای توزیع نرمال باشد در سطح معنی دار =.0 05 α و اطالعات یک نمونه تصادفی 4 تایی این ادعا را آزمون کنید = 4 x 1 = 1, x = 18, x 3 = 14, x 4 = 16 { H 0 : σ 5 H 1 : σ > 5 اولی X = 15 χ H 0 = 0 5 = 4 S = 0 3 دومی χ α ( 1) if 4 > α The Rej H 0 49

آزمون فرض در سطح معنی دارα برای مقایسه واریانس های دو جامعه نرمال مستقل از هم X~N(μ 1, σ 1 ) Y~N(μ, σ ) { H 0 : σ σ 0 H 1 : σ < σ 0 { H 0 : σ σ 0 H 1 : σ > σ 0 { H 0 : σ = σ 0 H 1 : σ σ 0 کمیت محوری برای هر 1 دسته فرضیه F فیشر می باشد f H 0 S 1 S ~F(m 1, 1) ناحیه بحرانی و نوع تصمیم گیری در این آزمون )برای هر سه مورد( مثل ناحیه بحرانی و نوع تصمیم گیری برای یک جامعه )برای واریانس ) است با این تفاوت که در اینجا از F فیشر استفاده می شود در حالیکه در واریانس یک جامعه از کای استفاده می شود. (m 1, 1) F H 0 < F 1 α F H 0 > F α (m 1, 1) (m 1, 1) F H 0 < F 1 α Rej H 0 Rej H 0 (m 1, 1) or F H 0 > F α Rej H 0 مثال ) ادعا شده که نوسانات اثر بخشی آزمون ضمن خدمت روی عملکرد کارکنان در دو سازمان A و B یکسان نیست در معنی دار =.0 05 α و اطالعات زیر در دست است قبل از آزمون چه فرض هایی الزم است X و Y دارای توزیع نرمال و مستقل از هم هستند 50 X i = 600 50 (X i ) = 649 51